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基于 谱 域 特征 提取 与 线性 回归 分 类 的 智能 人 脸 识别 算法 
DROGE, "RB 


(西南 石油 大 学 计算 机 科学 学 院 , 成 都 ”610500) 


摘 要: 针对 人 脸 识别 中 由 于 光线 、 表 情 变化 和 遮挡 导致 人 脸 图 像 变化 的 问题 ， 提 出 了 一 种 谱 域 特征 提取 与 线性 回归 
分 类 算法 相 结 合 的 智能 人 脸 识别 方法 。 为 了 实现 特征 提取 的 目的 ,首先 使 用 Viola-Jones 算法 从 原始 图 像 中 提取 初始 人 
脸 部 分 ， 并 将 其 转换 为 120X 120 像素 大 小 的 灰 度 图 像 ; 然后 提出 了 一 种 计算 极 坐 标 全 里 叶 变换 (FFT) 以 获得 预 处 理 
人 脸 图 像 主要 幅度 谱 特征 的 新 框架 ， 进 一 步 在 预 处 理 的 图 像 上 执行 2D-DFT， 并 表示 为 1D P-FFT。 特 征 值 是 1D P-FFT 
幅 值 中 的 最 大 值 , 提取 的 特征 值 用 于 构造 表示 人 脸 图 像 的 符号 对 象 。 最 后 利用 快速 有 效 的 线性 回归 分 类 算法 实现 分 类 。 
在 AR 和 GT 数据 库 上 进行 了 各 种 实验 ， 分 别 取得 了 97.51% 和 98.02% 的 准确 率 。 与 最 近 报 道 的 一 些 人 脸 识别 技术 相 
比 ， 提 出 的 方法 识别 准确 率 更 高 。 
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Intelligent face recognition algorithm based on spectral feature extraction and 
linear regression classification 


Chen Wenbin, Zeng Lulin 
(School of Computer Science, Southwest Petroleum University, Chengdu 610500, China) 


Abstract: Aiming at the problem of face image change caused by light, expression change and occlusion in face recognition, a 
smart face recognition method combining spectral domain feature extraction and linear regression classification algorithm is 
proposed. For the purpose of feature extraction, the initial human face part is first extracted from the original image using the 
Viola-Jones algorithm and converted into a grayscale image with a size of 120 X 120 pixels. Then, a new framework is 
proposed to compute the polar amplitude Fourier transform (FFT) to obtain the main amplitude spectral features of the 
preprocessed face image. The 2D-DFT is further performed on the preprocessed image and expressed as a 1D P-FFT. The 
eigenvalue is the maximum value of the 1D P-FFT amplitude, and the extracted eigenvalue is used to construct a symbol 
object representing a face image. Finally, classification is implemented using a fast and efficient linear regression classification 
algorithm. Various experiments were performed on the AR and GT databases, achieving 97.5196 and 98.0296 accuracy, 
respectively. Compared with some recently reported face recognition techniques, the proposed method has higher recognition 
accuracy. 
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0 引言 了 提高 人 脸 识 别 系统 的 性 能 ， 找 到 一 个 好 的 特征 提取 器 和 一 个 
有 效 的 分 类 器 是 至 关 重 要 的 。 此 外 ， 还 需要 降低 所 提取 的 特征 

人 脸 识 别 是 计算 机 视觉 、 人 工 智 能 、 模 式 识别 和 生物 识别 ”空间 的 维度 , 以 便 提高 该 算法 在 其 分 类 过 程 中 的 效率 和 和 鲁 棒 性 。 
领域 的 一 个 活跃 的 研究 领域 0 。 与 其 他 生物 识别 方式 (如 指纹 、 近年 来 ， 许 多 基于 外 观 的 人 脸 识别 系统 被 开发 出 来 ， 以 减 
虹膜 、 手 印 等 ) 相 比 ， 人 脸 识 别 的 最 重要 优势 在 于 它 可 以 在 远 — 少 面部 图 像 分 类 所 需 的 计算 时 间 。 一 些 文献 提出 基于 外 观 的 人 


距离 和 友好 的 方式 下 
方法 已 经 被 提出 和 开发 。 然 而 这 些 人 脸 识 别 方法 在 光照 变化 和 ” ”的 特征 值 ， 并 使 用 单 值 变量 表示 [71。 但 是 这 样 的 单 值 变 量 可 


— 


了 。 在 过 去 的 几 十 年 中 ， 许 多 人 脸 识 别 仿 识 别 系统 。 这 些 文献 直接 使 用 人 脸 图 像 像素 强度 值 作为 识别 


fff 


和 有 效 的 分 类 方法 是 人 脸 识 别 系统 的 两 个 主要 步骤 。 因 此 ， 为 ”特征 数据 。 研 究 人 员 为 了 开发 特征 数量 更 少 的 高 效 系统 ， 采 


E 谈 挡 的 情况 下 识别 准确 率 受到 严重 影响 申 。 提 取 最 优 特征 。 ”无 法 捕捉 同一 主题 图 像 的 特征 值 的 变化 ， 并 且 也 将 具有 高 维 
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了 特征 学 习 方法 


。 特 征 学 习 或 主动 学 习 在 通过 区 分 表征 


或 构建 


Vv 合作 其 
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训练 图 像 数据 〈 提 取 特征 ) ， 以 提高 分 类 任务 的 性 能 方面 起 着 n- " 

重要 作用 。 因 此 ， 近 年 来 研究 人 员 已 经 提出 了 许多 主动 学 习 方 上 -2pfor Ne, 

法 ， 它 们 将 训练 样本 的 代表 性 与 信息 性 结合 起 来 以 获得 更 好 的 N. 2 

分 类 准确 性 。 其 中 ,文献 [8] 提出 了 一 种 有 监督 的 特征 学 习 模 型 

来 分 类 低 维 和 高 维 数据 。 该 技术 使 用 判别 回归 方法 估计 回归 向 Ey x uiia B 

量 来 估计 测试 数据 和 训练 数据 之 间 的 相似 性 。 然 而 ， 当 低 维 或 eoe DiN apat 

高 维 图 像 数据 受到 诸如 遮挡 、 几 何 变 化 和 照明 等 情况 时 ， 分 类 mU X S 

任务 变 得 具有 挑战 性 外。 ER C 错误 ! 未 找到 引用 源 。 和 (2) 错误! 未 找到 引用 源 。 
研究 表明 ， 符 号 对 象 提供 了 一 种 有 效 的 方法 来 表示 关于 人 Ps N 表示 伪 极 坐标 网 格 中 同心 正方 形 的 数量 。 文 献 [14] 的 有 

脸 图 像 的 这 种 可 变 信息 。 本 文 提 出 了 一 种 用 于 人 脸 识别 的 基于 ARH, 为 了 计算 传 里 叶 变换 值 ， 在 给 定 的 伪 极 坐标 网 格 点 ys 

新 颖 外 观 识别 方法 的 谱 域 特征 提取 算法 ， 有 效 利用 了 人 脸 图 像 M ps 的 情况 下 ， 一 个 简单 的 ID-FFT 就 可 以 得 到 令 人 满意 的 

中 的 局 部 空间 变化 ， 如 光照 、 表 情 。 为 了 特征 提取 的 目的 ， 所 ”效果 。 为 了 得 到 几何 上 的 直线 ，ys 和 prs 伪 极 坐标 网 格 点 必须 

提出 的 方法 使 用 与 傅 里 叶 分 析 相关 的 技术 ， 其 中 当 在 极 坐标 中 ”在 轴 向 和 径 向 同时 过 采样 ， 即 在 伪 极 坐标 网 格 中 需要 均 布 的 点 


观察 时 ， 频 率 集合 等 于 Averbuch 等 人 00 提 出 的 等 式 。 此 外 , 在 
极 坐标 网 格 中 ， 生 成 的 快速 全 里 叶 变换 (fast Fourier transform, 


FFT) 特征 被 评估 为 单 维 等 距 极 坐标 FFT 值 


Cpolar-FFT) 。 


来 自 ID P-FFT 的 最 大 量 值 用 于 表示 面 


转换 为 1D P-FFT 


部 识别 


的 特征 值 。 此 外 ， 本 文 还 利用 符号 建 模 方 法 更 好 地 表示 提取 的 
特征 。 因 此 ， 所 提出 的 工作 引入 了 一 种 新 的 符号 建 模 技 


技术 仅 依 靠 原始 数据 的 外 观 来 减少 2D-DFT 频谱 特征 的 
快速 有 效 的 线性 民 
和 GT? 数据 库 进行 了 各 种 实验 ， 证 明了 本 文 方法 的 准确 性 。 


最 后 利 | 


术 ， 该 


归 分 类 算法 实现 分 类 。 


通过 对 ARI! 


1 谱 分 析 与 极 坐标 FFT 的 计算 


对 于 许多 图 


像 处 理应 用 来 说 ， 对 极 坐标 中 传 里 叶 变 


速 和 准确 估计 


直 是 
提出 了 几 种 技术 来 解决 这 些 问 题 。 
坐标 或 对 数 极 坐标 傅 里 叶 


个 主要 挑战 。 在 过 去 的 几 十 年 中 


T 


换 的 快 
， 已 经 


文献 中 有 两 种 方法 来 


计算 极 


^A 


变换 ， 甚 区 别 在 于 直接 在 二 维 


IAM 


FFT 域内 的 原始 
值 。 由 于 存在 插 


上 进行 插值 还 是 在 处 理 后 的 图 像 中 


图 像 


进行 插 


不 能 i 


值 误 差 ， 基 于 快速 傅 里 叶 变 换 的 图 像 配 准 


全 确 地 恢复 新 变换 的 数据 ， 甚 至 无 法 恢复 大 尺度 因子 。 


相位 相关 的 过 程 中 ，FFT 方法 经 常 遭 遇 错 误 的 峰值 。 伪 


FFT 因此 被 提出 


， 并 且 在 图 像 配 准 中 进行 了 测试 。 在 茶 


极 坐 标 


些 条 件 


F, 这 些 方法 在 计算 与 二 维 FFT 相同 复杂 度 的 极 坐 标 傅 


换 时 能 够 显著 降 


里 叶 变 


FFT 的 算法 PPFFT 可 


以 通过 迭代 过 程 将 尺度 恢复 到 4。 


FFT 还 可 | 


j 于 改进 或 简化 计算 极 坐标 网 格 中 的 频率 值 的 


里 步骤 。 


极 坐标 FFT 


的 实现 中 , 首先 是 在 频 域 中 定义 伪 极 坐 


点 ， 将 这 些 点 分 为 垂直 子 集 VS 和 水 平子 集 ps 。 在 伪 极 


格 中 ，VS 和 gus 


这 些 方 块 边 的 大 小 为 zz/N ， 其 中 1=0,L..sN 。 
2p/N,-N/2<p<N /2 和 均 布 斜坡 。Hs 射线 与 之 类 似 , 但 顺 


时 针 旋 转 90°. 


氏 插值 误差 。 文 献 [13] 提 出 的 基于 伪 极 坐标 


极 坐 标 


标 网 格 
坐标 网 


点 以 同心 


[rm 


一 般 ys 和 grs 网 格 点 可 以 表示 如 下 : 


为 中 心 ， 非 等 间隔 分 布 于 射线 上 ， 
Vs 射线 有 


| 


4E . 这 种 伪 极 坐标 网 格 的 转换 涉及 两 个 操作 。 通过 旋转 射线 得 
到 轴 向 均匀 的 射线 采样 ,并 通过 将 圆 变换 成 正方 形 (如 同 极 坐 
标 系 中 所 要 求 的 那样 ) 得 到 同心 圆 。 为 了 获得 轴 向 均 布 的 射线 
采样 ， 用 tan(Nxp/12) EX (1) 和 (2) re Re B 2p/N 
形成 新 的 网 格 点 Vs 和 HS, ， 这 些 新 的 网 格 点 可 以 通过 下 式 
计算 : 


& =Z por - N &t« N, 
N 


VS 2— ] N (3) 
A cp 
= 一 tan for <p< 
5 N EJ 2 P 


new 


mt 
Ge mL 


T] m, (ap N N 
= 一 tan for <p< 
* N (2) 2 ?773 


HS (4) 


new 


新 的 网 格 点 Vs, 和 HS, 仍然 以 同心 方 格 的 方式 组 织 ， 但 
是 射线 则 根据 角度 而 不 是 斜率 等 距 分 布 。 为 了 将 圆 形 变换 为 正 
方形 ,根据 其 角度 上 M E 沿 每 条 射线 除 以 一 个 常数 ， 因 此 参数 
p 的 函数 为 


&(p)- [1e (25 JY 6) 
网 格 的 结果 如 式 (6) 所 示 。 
é =T for-N<1<N, 
(p) (6) 


é= di tan 
i NR(p) 


新 的 伪 极 坐标 网 格 点 Vs 和 HS, 位 于 一 条 线 上 ， 并 且 以 
不 同 的 间距 等 间距 分 布 。 通过 使 用 式 (6) ， 频 率 的 新 极 坐标 网 
格 点 可 以 被 定义 为 


(Z5 re Seps 


D 


ea ={ msn], g [mn] 0) 


在 基础 区 域 < < [zz 了 中， 采样 频率 可 以 表示 为 
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ék[m,n] = Ae cos(an /2N) 


8 
él[m,n]- A singm/ 2N i 


for -N€mcN-1,0 < n2 N- 
大 体 来 看 ， 极 坐标 DET 映射 PDFT: c[m, n] >T(E,,) Œ 
一 个 线性 算 子 。 
2 ”人 脸 识别 的 符号 数据 建 模 方法 


任何 类 型 的 生物 识别 系统 的 识别 准确 性 都 依赖 于 从 训练 生 
物 特征 集合 中 提取 的 差异 特征 。 在 本 文 所 提出 的 工作 中 ， 使 用 
频 域 变 换 来 提取 空间 域 中 的 局 部 变量 。 使 用 FET 获得 的 频 域 特 
征 , 在 频 域 中 表示 不 同 的 照明 、 表 情 变化 和 遮挡 等 情况 。 此 外 ， 
保留 低频 分 量 以 便 提 取 分 类 所 需 的 差异 特征 。 在 极 坐标 网 格 中 ， 
生成 的 FFT 特征 被 评估 为 单 维 等 距 极 坐标 FFT 值 并 转换 为 1D 
P-FFT。 一 维 极 坐标 FFT 中 的 最 大 幅度 值 被 认为 是 人 脸 图 像 的 
特征 描述 符 ， 并 且 被 用 来 表示 符号 对 象 。 所 提出 的 工作 使 用 与 
其 他 基于 外 观 的 人 脸 识别 系统 不 同 的 特征 表示 ， 并 且 使 用 
个 特征 值 来 表示 整个 脸 部 图 像 。 不 同人 脸 上 的 面部 特征 点 如 图 


1 所 示 。 
r 


图 1 不 同人 脸 上 的 面部 特征 点 
此 外 ， 对 于 属于 同一 类 的 符号 对 象 由 区 间 值 变量 表示 ， 即 
通过 面部 类 别 的 个 符号 对 象 的 最 大 和 最 小 量 值 确定 。 

本 文 描述 的 工作 使 用 FFT 的 周期 性 和 复 共 斩 对 称 性 来 进行 
数字 人 脸 图 像 数据 的 2D-FFT 分 析 。 传 里 叶 变换 用 于 将 图 像 信 
息 转 换 为 空间 频率 域 03。 人 脸 图 像 (m, n) 上 的 二 维 离散 傅 里 叶 
变换 (2D-DFT) 可 以 表示 为 

T(K,1) Sr nude 


其 中 : 坐标 (k,1) 表示 2D-DFT 系数 在 原始 谱 中 的 位 置 ; 而 坐标 
(m, n) 表示 图 像 + 中 响应 位 置 的 灰 度 级 。DFT 计算 的 高 效率 形 
式 是 快速 传 里 叶 变 换 (FFT) 。 图 像 的 FFT 可 以 将 图 像 信息 转 
换 到 频 域 空间 。FFT 算法 是 信号 和 图 像 处理 领 域 的 核心 ， 具 有 
广泛 的 应 用 领域 ， 如 电信 、 密 码 学 、 医 学 成 像 和 频谱 分 析 等 。 
在 频 域 工作 的 一 个 优点 是 一 些 具 有 较 高 幅 值 的 DFT 系数 足以 
代表 图 像 或 图 像 的 一 部 分 。 

在 这 项 工作 中 , 通过 使 用 Viola-Jones 算法 09 从 相应 标准 数 
据 库 的 原始 图 像 裁剪 人 脸 部 分 ， 并 进一步 将 其 转换 为 尺寸 为 
120x120 像素 的 灰 度 图 像 来 构建 人 脸 数据 库 ， 如 图 2 所 示 。 接 


nk- j^ nl ( 9 ) 


AH 
KR, F: 基于 谱 域 特征 提取 与 线 ， say NM 法 


下 来 对 已 处 理 图 像 应 用 FFT 以 生成 2D-DFT 系数 。 在 生成 的 
2D-DFT 系数 中 ， 低 频 分 量 分 布 在 频谱 的 角落 ， 表 示 图 像 中 存 
在 的 边缘 /线条 。 图 像 的 低频 分 量 包含 了 代表 特定 脸 部 图 像 所 需 
的 大 部 分 信息 ， 并 具有 较 高 的 辨别 力 。 然 而 有 助 于 获得 更 精细 


T 


jl 


细节 的 高 频 成 分 对 于 识别 不 太 重 要 ， 并 且 对 识别 过 程 没 有 有 效 
利用 频谱 


出 的 工作 中 ， 普 的 对 称 性 来 有 


贡献 。 因 此 ， 本 文 在 所 提 
效 地 保留 低频 分 量 。 


图 2 原始 图 像 

由 于 频谱 的 对 称 性 ， 象 限 位 置 可 以 对 角 交 换 。 通 过 考虑 这 
个 事实 ， 低 频 位 置 被 对 角 交 换 ， 使 得 低频 位 置 出 现在 图 
间 ， 即 偶数 和 奇数 象限 被 交换 以 有 效 地 计算 低频 分 量 。 真 实 轿 
像 的 DFT 的 基本 性 质 是 它 的 周期 性 和 复 共 斩 对 称 性 。 频谱 在 两 
个 方向 上 无 止 尽 地 重复 着 。 因 此 ， 只 有 DFT 频谱 的 非 元 余 系 数 
被 考虑 用 于 特征 提取 。 

与 使 用 面部 图 像 的 灰 度 值 获得 的 协 方差 矩阵 ( NRx NC ) 相 
比 ， 所 得 到 的 协 方 差 矩 阵 (NR/2+2)x(NMC/12 +2) 的 大 小 约 为 
四 分 之 一 。 因此 , 协 方差 矩阵 的 估计 可 能 对 于 特征 提取 更 准确 。 
在 这 项 工作 中 ， 通 过 在 新 的 合成 协 方差 矩阵 的 末尾 添加 一 串 零 
来 完成 零 填充 , 以便 与 人 脸 图 像 的 原始 大 小 , 即 NRx NC 相同 。 
现在 ， 通 过 参考 式 (9), 2D-DFT 可 以 针对 尺寸 为 NxN ( 假 
WEN 是 偶数 ) 的 人 脸 图 像 (m, n) 定义 新 频谱 ， 如 式 〈10) 所 


ZN o 


N12 N12 


r(k,l= Y > c(man)e 


m--NI2n--NI2 


2m 2m 
In IN" 
(10) 


where ian / ne 
2 2 


E C100. P, As (K, D) KIR 2D-DFT 系数 在 新 频谱 中 的 
位 置 ; 坐标 (m, n) 表示 图 像 r 相应 位 置 的 灰 度 值 。 在 非 元 余 系 
数 频谱 上 计算 新 的 2D-DFT 值 与 在 原始 频谱 上 计算 2D-DFT 是 
类 似 的 。 使 用 式 (10) 可 以 计算 非 元 余 DFT 频谱 (NRDFT) 
的 半径 和 相位 角 。 此 外 ， 非 元 余 傅 里 叶 频 谱 可 以 通过 DC 系数 
移动 到 中 心 的 DFT 频谱 的 系数 和 NRDFT 的 半径 的 卷 积 来 计 
算 。 相 位 谱 的 非 元 余 系数 用 于 脸 部 图 像 的 符号 表示 。 与 从 原始 
灰 度 人 脸 图 像 获 得 的 原始 大 小 相 比 ， 相 位 谱 的 新 表示 将 光谱 的 
大 小 减 小 到 其 四 分 之 一 上。 本 章 介绍 了 通过 极 坐 标 傅 里 叶 变换 
Cpolar Fourier transform, PFT) 分 析 NRDFT 进行 特征 提取 的 
方法 。PFT 生成 旋转 不 变数 据 ， 特 别 适合 提取 具有 细微 变化 的 
人 脸 图 像 的 方向 特征 。 
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于 伪 极 坐标 网 格 更 接近 极 坐 标 网 格 ， 所 以 伪 极 坐标 FFT 
到 极 坐标 FFT 的 转换 涉及 1D 等 间隔 FET， 并 且 只 有 单个 ID 
内 插 。 对 于 一 个 尺寸 为 Vx WN 的 给 定 的 二 维 人 脸 图 像 ， 极 坐标 


FFT 算法 产生 一 个 复杂 度 为 O(N?1ogN ) 的 极 坐标 FFT。 因 此 ， 


在 所 提出 的 工作 中 实现 伪 极 坐标 FFT 可 以 更 高 的 精度 和 更 快 的 
速度 计算 面部 特征 。 


3 ” 谱 域 特征 提取 与 线性 回归 分 类 


3.1 人 脸 特 征 的 符号 表示 

一 个 人 的 脸 部 图 像 可 能 在 表情 、 照 明和 让 挡 等 方面 有 所 不 
同 。 由 于 这 些 信息 的 存在 ， 那 些 使 用 更 少 特 征 值 的 传统 系统 难 
以 进行 精确 识别 。 符 号 对 象 提供 了 一 种 有 效 方法 来 表示 这 种 类 
型 的 信息 。 符 号 对 象 是 经 典 数 据 类 型 的 扩展 。 符 号 对 象 可 以 分 
为 断言 对 象 (assertion object), JRX Z (hoard object) 和 合成 对 
象 (Synthetic object) .断言 对 象 由 属于 给 定 对 象 的 一 组 事件 组 成 。 
事件 是 逻辑 链接 的 特征 变量 和 特征 值 /属性 对 的 组 合 。 一 个 或 多 
个 断言 对 象 的 组 合 称 为 转 积 对 象 L1， 一 个 或 多 个 围 积 对 象 的 组 
合 称 为 合成 对 象 。 
在 这 项 工作 中 , 初始 人 脸 图 像 是 从 原始 图 像 中 剪 切 出 来 的 ， 
并 且 用 于 提取 极 坐标 FFT 特征 《表示 为 断言 对 象 ) 。 符 号 面部 
对 象 被 描述 为 转 积 对 象 ， 并 由 不 同 的 断言 类 型 对 象 使 用 最 大 
最 小 规则 来 构建 。 假 设 人 脸 图 像 数据 集 包 含 C 个 图 像 类 别 ， 
个 类 别 由 s 个 图 像样 本 组 成 ， 这 些 人 脸 图 像样 本 在 表情 、 捞 
和 照明 方面 各 不 相同 。 令 OO = (run. Ts} 表示 一 个 人 脸 类 的 
5 个 样本 图 像 的 集合 ， 作 为 一 级 对 象 。 一 般 来 说 ， 所 有 人 脸 图 
像 的 类 别 都 可 以 表示 为 


pau 


UE A 


X-(OG,]vi-ltoCandvjo-ltosS — (1D 


其 中 : C 是 人 脸 类 别 的 数量 ， 而 s 表示 第 ;类 的 样本 数量 。 表 
示 属 于 第 ;类 的 面部 图 像 的 符号 数据 模型 的 向 量 sp 可 以 表示 
为 


SD? -irip(z),FiD(r,)....FiD(r,)) 
Vi-ltoC 
此 外 ， 使 用 spo 的 最 大 值 和 最 小 值 作为 第 ;类 的 符号 区 间 
数据 表示 ， 可 以 按 式 〈13) 计算 得 到 。 
FAD — MM" - (max(SD"), min(SD?) 
Vi-lto N 
进一步 ， 使 用 式 〈13 ) 所 表示 的 c 类 的 符号 知识 库 可 以 表 


(12) 


(13) 


SKB - (FID - MM'] vi-1to C (14) 


符号 知识 库 矩 阵 SKB 表示 所 有 的 C 类 ，SKB e RC?» C 
表示 人 脸 类 别 的 数量 ， 数 字 2 表示 FID-MM 的 最 大 值 和 最 小 
值 。 一 般 来 说 ， 第 ;类 的 符号 建 模 可 以 通过 式 〈15) 实现 : 
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so? ={SDO,FID-MMO} (18) 


其 中 : SD 是 FID(T)) 的 1xS HÆ; ppp. MM 07€ sp 的 最 


KEMEJA Yi=1,..,C> Vjekl.gSe Rho BER SKB 包 
含 每 个 类 的 s 个 样本 的 pup 的 最 大 值 和 最 小 值 ， 并 且 sp 矩阵 
包含 所 有 类 的 s 个 样本 的 ript. sp 和 矩阵 中 的 每 个 ppp 值 表 
示 一 个 图 库 脸 部 图 像 和 skB 和 矩阵 中 的 每 对 值 ， 即 第 ;类 的 最 大 
和 最 小 pip 值 代表 该 类 的 s 个 样本 。 所 提出 的 符号 数据 建 模 方 
法 仅 使 用 很 少 的 特征 值 来 表示 图 像 的 不 同 变化 。3.2 节 将 利用 
快速 有 效 的 线性 回归 分 类 算法 实现 分 类 。 

3.2 线性 回归 分 类 

使 用 线性 回归 方法 进行 人 脸 识 别 直 接 使 用 下 采样 的 人 脸 图 
像 作 线性 回归 分 析 ， 然 后 采用 最 近邻 分 类 器 进行 分 类 。 
基于 线性 回归 的 人 脸 识别 方法 基本 过 程 如 下 所 述 : 
输入 : 类 别 模型 X, s RU -12,..,C) 和 测试 图 像 向 量 
=R” 。 其 中 ，C 是 人 脸 的 类 别 数 ，s 是 第 ;类 人 脸 的 训练 图 
E: gq 是 每 个 图 像 的 特征 向 量 长 度 。 

E 始 训 练 图 OG 可 表 m 为 
We RPG=1,2,...,C;m=1,2,...,5) EK" ZI ax p 的 原始 人 脸 
图 像 下 采样 为 cxd 的 图 像 (c aud <b)， 然 后 按照 列 的 顺序 所 
接 为 一 个 长 度 为 4= cxd 的 一 维 向 量 xr : 

AL € Ree — X € RoS (16) 
其 中 : q=cxd 并 且 cxqd <axb， 因 此 类 别 模型 x, 可 表示 为 


n 


X, 2 [x x7... xP] e ROS (17) 
输出 : y 的 类 别 。 
计算 过 程 ， 
a) 针 对 每 个 类 别 模型 ， 计 算 参 数 向 量 ; 
3 (18) 


PX XV XT yii 21,2,...,C 


b) 根 据 参 数 向 量 了 ， 计 算 预测 向 量 8 。 Rev 。 


y, = X, f.i -12,..,C (19) 
o) 计 算 原始 向 量 与 预测 向 量 之 间 的 距离 。 
4)-|»-» 4 512,...C (20) 
2 


d) 测 试图 像 y 的 类 别 由 最 近邻 准则 给 出 ， 若 d Cy) 满足 


d (9) = mind;();i =1,2,...,C 


则 y 被 分 为 第 j 类 


4 ”实验 结果 


为 了 评估 本 文 所 提出 的 方法 的 性 能 ， 在 公共 人 脸 数据 库 如 
AR 和 佐治 亚 理 工学 院 (GT) 数 据 库 上 进行 了 多 次 实验 。 所 提出 
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的 工作 的 实现 平台 是 配备 2.5 GHz Intel@B960 和 2 GB DDR3 
RAM 的 计算 机 ，MATLAB 版 本 为 2012a。AR 数据 库 由 120 
个 人 的 人 脸 数 据 组 成 ， 每 个 会 话 13 个 图 像 (图 3)。 所 有 人 的 26 
个 面部 图 像样 本 在 两 个 会 话 中 被 捕获 ， 其 展现 出 不 同 的 照明 、 
表情 和 遮挡 。 


(a) (b) (c) (d) 
(e) (f) (9) (h) 


图 3 一 个 来 自 于 AR 数据 库 的 典型 样本 

GT 数据 库 包括 50 个 主题 ， 每 个 主题 有 15 KAA, È 
述 了 几 个 变化 ， 如 姿势 、 表 情 、 杂 乱 的 背景 和 照明 (图 A). M 
部 图 像 中 存在 光线 条 件 的 变化 ， 面 部 表情 〔 睁 眼 / 闭 眼 ， 微 笑 / 
不 微笑 ) 和 遮挡 细节 ( 戴 眼 镜 /不 戴 眼镜 ) 。 与 AR 数据 库 中 的 
人 脸 图 像 相 比 ，GT 数据 库 的 图 像 在 表情 、 姿 势 、 谈 挡 、 年 龄 、 
光照 、 分 状 率 以 及 背景 等 方面 有 很 大 的 不 同 。 


图 4 一 个 来 自 GT 数据 库 的 典型 题材 样本 
在 本 文 所 提出 的 算法 中 , 最初 使 用 Viola-Jones 算法 将 所 有 


数据 库 中 的 图 像 裁剪 成 120X120 像素 尺寸 ， 并 转换 成 灰 度 图 
像 。 在 AR 数据 库 中 ， 类 别 1 图 像 编 号 从 1~13， 类 别 2 图 像 纺 
号 从 14-26. 为 了 构建 用 于 各 种 实验 的 120 人 的 图 像 库 ， 从 AR 
数据 库 中 选择 类 别 1 的 1 200 个 样本 和 类 别 2 的 1 200 个 样本 ， 
划分 为 表 1 中 所 列 出 的 5 个 子 集 。 
表 1 AR 数据 库 不 同 集合 的 分 布 


图 像 变化 类 型 类 别 1 图 像 ( 训 练 集 ) ”类 别 2 图 像 (测试 集 
光照 变化 1, 5-7 14, 18-20 
表情 变化 1-4 14, 15-17 
太阳 镜 或 围巾 遮挡 8,11 21,24 
戴 围 巾 和 光照 变化 8,9 23-25 
戴 太阳 镜 和 光照 变化 12, 13 22, 23 


| Chin&Xiy 命 作 期 刊 
HR, F: 基于 谱 域 特征 提取 与 线性 回归 分 类 的 智能 人 脸 识 别 算 法 


4.1 使 用 AR 数据 库 的 性 能 比较 

在 本 节 中 分 析 了 所 提出 的 符号 建 模 和 识别 技术 的 准确 性 ， 
与 文献 [18] 以 及 文献 [19] 中 算 提 出 的 最 新 方法 进行 了 性 能 比 
较 ， 这 些 方法 与 本 文 所 提出 的 方法 相似 。 

文献 [I9] 提出 了 一 种 基于 局 部 逼近 梯度 与 LDA 

(LAG-LDA) 技术 的 人 脸 识别 方法 ， 并 对 AR 数据 库 进行 了 各 
种 实验 ， 称 为 expl 到 exp8。 对 于 实验 1~4， 笔 者 使 用 了 类 别 1 
的 从 1 至 4 编号 的 图 像 ， 并 且 对 于 实验 5~8， 他 们 使 用 了 类 别 
1 的 编号 从 8~13 的 图 像 用 于 训练 并 且 用 于 测试 所 有 AR 数据 库 
图 像 的 不 同 组 合 。 对 于 不 同 的 面部 表情 和 光照 变化 。 在 表 2 中 
展示 了 本 文 所 提出 的 方法 和 LAG-LDA 方法 在 AR 数据 库 上 的 
性 能 比较 。 
K2 本文 所 提出 的 算法 与 LAG-LDA 算法 在 AR 数据 库 上 的 性 能 比较 
用 巾 遮挡 + 光 太阳 镜 遮 挡 + 光照 


光照 变化 ( 子 表情 变化 CT 


方法 丸 变 化 〈 子 集 变化 ( 子 集 HTE 
集 1) 集 2) 
3) 5) 
LAG-LDA 
~ 90.13%(Exp6)91.62%(Exp1) 79.33%(Exp8) 93.03%(Exp7) 
方法 
本 文 方法 96.39% 93.93 % 94.64% 95.46% 


dé 2 中 的 结果 证 明了 本 文 所 提出 的 方法 的 有 效 性 。 该 方法 
在 AR 数据 集 上 的 光照 变化 〈 子 集 1) 、 表 情 变化 〈 子 集 2) 以 
及 同时 包含 光照 变化 和 遮挡 影响 ( 子 集 4 和 5) 方面， 实现 了 
比 LAG-LDA 方法 更 好 的 性 能 。 
另 一 种 类 似 的 方法 ， 即 Waqas Jadoon 等 人 提出 的 扩展 协同 
居 表 示 (ECNR) 技术 (9 站。 本 文 方法 与 这 一 方法 在 AR 数据 
集 上 进行 性 能 比较 ，ECNR 方法 在 光照 变化 、 表 情 变 化 、 存 在 
遮挡 以 及 遮挡 和 光照 变化 同时 存在 的 情况 下 对 人 脸 图 像 的 识别 
分 别 实现 了 90. 4596. 87.9496, 89.329481 83.42% 的 最 佳 识别 
率 。 表 3 中 列 出 了 本 文 所 提出 的 方法 和 ECNR 方法 所 在 AR 数 
据 库 上 获得 的 实验 结果 。 
从 表 3 中 同样 可 以 得 出 一 些 结论 ， 其 中 在 表情 变化 〈 子 集 
2) 、 光 照 遮 挡 〈 子 集 4 和 5) 的 情况 下 ， 本 文 所 提出 的 方法 的 
最 佳 识别 率 明 显 优 于 ECNR 方法 。 在 光照 变化 的 情况 下 〈 子 集 
1) 本 文 得 到 了 与 ECNR 方法 相近 的 识别 率 。 然 而 与 ECNR 7j 
法 相 比 ， 在 存在 遮挡 〈 子 集 3) 的 情况 下 ， 本 文 所 提出 的 技术 
的 识别 率 稍 低 。 
表 3 本 文 提 出 的 算法 与 ECNR 算法 在 AR 数据 库 上 的 性 能 比较 


Am 
c 


, 光照 变化 〈 子 表情 变化 ( 子 存 在 遮挡 ( 子 遮挡 + 光照 变化 〈 子 
dd 4D 集 2) 集 3) 集 4+ 子 集 5) 
ECNR Jji ^ 904596 87.94% 89.32% 83.42% 
本 文 方法 91.05% 93.43% 88.2496 91.36% 


本 文 所 提出 方法 的 准确 性 与 一 些 监督 学 习 方 法 〈 如 极 小 极 
大 值 框架 ) 相当 ， 后 者 处 理 一 类 高 维 AR 图 像 数 据 集 存在 失真 
问题 。 为 了 实验 目的 ， 类 似 的 设置 已 经 按照 文献 [18] 中 的 定义 
完成 。 即 统一 选择 25 名 男性 和 25 名 女性 的 脸 部 图 像 ， 将 所 
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图 像 缩 小 至 32X32 像素 ， 并 在 整个 数据 集 上 使 用 10 折 交 叉 验 


i 
模 


四 


L 


. A A 列 出 了 本 文 所 提出 的 方法 以 及 GMD (广义 乘法 失真 ) 
型 和 文献 [18] 中 提 到 的 其 他 技术 实验 所 得 到 的 实验 结果 ( 结 


果 取 自 文献 [18]〉。 


表 4 本 文 提出 的 算法 与 最 小 最 大 值 框架 在 AR 数据 库 上 的 性 能 比较 
方法 准确 率 (%) 
GMD 92.88 

GMD(R) 98.50 
SRC 93.29 
RF 89.80 

SVM(P) 38.30 

SVM(R) 94.55 

KNN(E) 95.64 

KNN(C) 96.59 

KLDA(P) 94.72 

KLDA(R) 97.33 

本 文 方法 97.51 


C 
和 


的 
小 


的 


表情 变化 和 遮挡 等 情况 下 的 人 脸 图 像 识别 
4.2 使 用 GT 数据 库 的 性 能 比较 


表 4 显示 了 所 提出 的 方法 与 文献 [18] 中 提 到 的 其 他 现 有 技 


术 分 类 器 : GMD, SRC, RF, GMD (R) , SVM (P) 、SVM 


R) , KNN CE) , KNN (C). KLDA (P) , SVM R) 
KLDA (R) 相 比 〈 除 了 GMD R) 分 类 器 ) 的 比较 ， 本 文 


所 提出 的 技术 在 AR 数据 库 上 实现 了 最 佳 的 识别 准确 率 。 


从 表 2 和 4 的 结果 可 以 看 出 ， 本 文 所 提出 的 用 于 人 脸 识 别 
符号 相似 度 方法 的 识别 准确 度 比 从 ECNR、LAG-LDA 和 极 
极 大 值 框架 方法 所 获得 的 识别 准确 度 要 高 ,并 且 对 光照 变化 、 


有 一 定 的 鲁 棒 性 。 


本 文 所 提出 的 符号 建 模 和 相似 性 分 析 方法 的 性 能 也 与 文献 


[20] 中 所 定义 的 一 些 类 似 方 法 进行 了 比较 ， 并 且 也 进行 了 类 似 


实验 设 


,将 从 GT 数据 库 的 原始 人 脸 图 像 , 使 用 


Viola-Jones 


方法 将 人 脸 部 分 裁剪 成 120X120 像素 的 大 小 的 图 像 。 为 了 进行 


3k 


验 ， 从 每 个 人 的 图 像 中 随机 选择 六 幅 图 


像 进行 训练 ， 其 余 图 


像 被 用 于 测试 阶段 。 表 5 列 出 了 从 文献 20] 中 提 到 的 方法 与 本 


文 所 提出 的 方法 对 GT 数据 库 的 图 像 进 行 识 别 的 实验 结果 。 
表 5 本 文 所 提出 的 算法 与 文献 [20] 中 所 提出 的 方法 在 GT 数据 集 下 进 
行 识别 的 性 能 比较 
方法 识别 率 /% 

Fisherfaces 91.80 
Eigenfaces 87.65 
Symbolic PCA 94.85 
Symbolic ICA 89.15 
Symbolic KPCA 95.45 
Symbolic LDA 97.50 
本 文 方法 98.02 


表 5 的 实验 结果 表明 , 本 文 所 提出 的 方法 优 于 Fisherfaces、 


Eigenfaces、 符 号 PCA 方法 、 符 号 ICA 和 符号 KPCA 以 及 符号 
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LDA 方法 。 
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于 人 脸 识 别 的 谱 域 特征 提取 算法 ， 有 效 


本 文 提出 了 


利用 


了 人 脸 图 局 部 空间 变化 。 最 初 ， 使 用 Viola-Jones 算 


5g 
+ 
c 


法 将 人 脸 从 图 像 中 裁剪 出 来 , 并 转换 成 尺寸 为 120X 120 像素 的 


灰 度 图 像 。 在 预 处 理 


上 执行 2D-DFT。2D-DFT 系数 的 主 


的 图 像 


要 量 值 是 使 用 极 性 傅 里 叶 变 换 技术 计算 的 ， 并 表示 为 1D 


P-FFT。 特 征 值 是 ID P-FFT 


书 值 中 的 最 大 值 。 提 取 的 特征 值 用 


于 构造 表示 人 脸 
日 分 类 算法 实现 分 类 。 由 于 使 用 了 极 坐标 FFT， 所 提出 的 方法 
不 仅 有 效 ， 而 且 比 基于 笛 卡 尔 傅 里 叶 变 换 的 其 他 方法 更 精确 。 
本 文 提 出 的 符号 建 模 方 法 不 仅 提 


还 提高 了 识别 


Ne 


D 


像 的 符号 对 象 。 最 后 利用 快速 有 效 的 线性 下 


上 共 了 表示 人 脸 特征 的 新 方法 ， 
的 准确 性 。 对 AR 和 GT 数据 库 所 获得 的 实验 结 


分 析 ， 并 与 其 他 一 些 最 近 报 道 的 方法 进行 了 性 能 


果 进 行 了 详 旨 n 
比较 ， 本 文 所 提出 的 方法 的 性 能 令 人 满意 。 
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